machine learning模型也會失誤,我們需要用一個方法來衡量結果,才能知道該如何改進我們的模型。
我們不會只用一種衡量標準來判定模型的好壞,以人臉偵測的例子來看,我們有許多的人臉跟非人臉當做測試資料,當然我們會用這些測資來做測試跑出一個結果,此外我們更會把這些人臉跟非人臉在做細分,例如:禿頭人臉,被彩繪的人臉,石像...等等,如果某一個子項特別糟糕,我便可以針對這個子項目做加強。
衡量machine learning模型好壞的方法,最基本的就是用一個confusion merics來一次看出模型的TP,TN,FP,FN的結果。TP,TN,FP,FN分別可以看作是一個子項目,他們分別的意思是:
TP:正樣本被模型認成對的
TN:正樣本被模型認成錯的
FP:負樣本被模型認成對的
FN:負樣本被模型認成錯的
其中FP被稱作type1 error,FN被稱作type2 error